A 'Silent Trial' Assessing the Accuracy of Large Language Models for Assisting Community Health Workers in Low-Resource Settings
Este estudo avaliou a precisão de modelos de linguagem grandes (LLMs) na assistência a agentes comunitários de saúde em Ruanda, revelando que, embora o modelo o3 da OpenAI tenha desempenho comparável ao dos agentes (que já apresentavam alta precisão de 97,9%), o modelo Gemini Flash 2.5 foi inferior, sugerindo que a escolha do modelo é crítica e que os LLMs podem ter impacto limitado em programas já bem estabelecidos, mas serem úteis em contextos menos desenvolvidos.
Shimelash, N., Rutunda, S., Menon, V., Emmanual-Fabula, M., Uwimbabazi, A., Rugege, C., Nshimiyimana, C., Rwema, I., Kandekwe, M., Berhe, D. F. D., Wong, R., Remera, E., Hezagira, E., Gill, J., Archer (…)2026-02-17📄 primary care research